Pengantar Visi Komputer dan Pemrosesan Citra Digital
Visi Komputer adalah bidang kecerdasan buatan yang memungkinkan komputer mengekstraksi informasi bermakna dari citra digital dan video, secara efektif berusaha mengatasi kesenjangan semantik antara data piksel mentah dan pemahaman tingkat manusia.Pemrosesan Citra Digital berfungsi sebagai lapisan dasar bagi Visi Komputer, dengan fokus pada manipulasi dan peningkatan sinyal citra melalui transformasi piksel-ke-piksel untuk mempersiapkan data agar siap digunakan dalam tugas-tugas interpretatif tingkat tinggi.
Prinsip Utama
- Representasi Data: Pada tingkat mesin, citra merupakan sebuah tensor yang bukan gambar keseluruhan. Citra abu-abu berupa matriks 2D nilai intensitas, sedangkan citra warna merupakan tensor 3D yang merepresentasikan Saluran Merah, Hijau, dan Biru (RGB) dengan dimensi $H \times W \times 3$.
- Transformasi vs. Interpretasi: Pemrosesan Citra Digital lebih banyak berfokus pada operasi citra-ke-citra seperti pengurangan noise, perbaikan ketajaman, atau penyamaan histogram. Visi Komputer lebih berfokus pada operasi citra-ke-knowledge seperti klasifikasi objek, lokalitas, dan segmentasi.
- Paradigma Grafika Terbalik: Visi Komputer dapat dipandang sebagai kebalikan dari Grafika Komputer. Sementara grafika bertujuan menciptakan dunia visual dari model matematis, visi bertujuan memulihkan struktur 3D dan label semantik dari proyeksi 2D.
Tantangan Inti
Tantangan utama di bidang ini adalah Kesenjangan Semantik, yaitu jarak antara nilai piksel tingkat rendah yang diproses oleh mesin dan konsep tingkat tinggi yang dipahami oleh manusia.
Implementasi Python
Pertanyaan 1
Proses mana yang dikategorikan sebagai operasi citra-ke-knowledge?
Pertanyaan 2
Pada tingkat mesin, struktur data citra warna standar apa?
Studi Kasus: Sistem Diagnostik Medis
Baca skenario di bawah ini dan jawab pertanyaannya.
Sebuah rumah sakit sedang mengembangkan sistem diagnostik medis otomatis baru yang dirancang untuk menganalisis pemindaian X-ray guna mendeteksi kemungkinan patah tulang. Sistem ini memproses data mentah dari mesin X-ray dan menghasilkan laporan diagnostik untuk radiolog.
P
1. Jika sistem menerapkan peningkatan kontras agar struktur tulang terlihat lebih jelas, apakah ini Pemrosesan Citra Digital (DIP) atau Visi Komputer (CV)?
Jawaban:
Pemrosesan Citra Digital. Peningkatan kontras adalah transformasi citra-ke-citra yang meningkatkan kualitas visual sinyal tanpa mengekstrak makna semantik.
Pemrosesan Citra Digital. Peningkatan kontras adalah transformasi citra-ke-citra yang meningkatkan kualitas visual sinyal tanpa mengekstrak makna semantik.
P
2. Jika sistem secara otomatis menandai area tertentu sebagai kemungkinan patah tulang, tugas apa yang dilakukan sistem tersebut?
Jawaban:
Visi Komputer / Deteksi Objek. Sistem ini menafsirkan isi citra untuk mengekstrak pengetahuan tingkat tinggi (menemukan lokasi patah tulang).
Visi Komputer / Deteksi Objek. Sistem ini menafsirkan isi citra untuk mengekstrak pengetahuan tingkat tinggi (menemukan lokasi patah tulang).
P
3. Mengapa pengurangan noise penting sebelum menjalankan algoritma deteksi?
Jawaban:
Untuk meningkatkan kualitas sinyal dan mengurangi hasil positif palsu dalam tahap interpretasi semantik. Noise dapat salah ditafsirkan oleh algoritma CV sebagai fitur atau tepi nyata.
Untuk meningkatkan kualitas sinyal dan mengurangi hasil positif palsu dalam tahap interpretasi semantik. Noise dapat salah ditafsirkan oleh algoritma CV sebagai fitur atau tepi nyata.